Dan Rose AI | 应用人工智能博客领域信息情报检索

这个博客是关于应用人工智能的,主要关注与AI相关的当下知识,适合那些想要应用人工智能的人。角度更多是AI在商业方面而不是技术方面。因此,文章大多是给产品经理、领导者或那些好奇AI在商业中是如何工作的人的实用建议。

生成式 AI 在商业环境中有何新意?

What's new about generative AI in a business context?

过去八年,我一直在研究人工智能,学习在商业中构建和应用人工智能解决方案的来龙去脉。在犯了无数错误之后,我创建了自己的构建和应用该技术的方法。这一切都很好,直到 2022 年秋天,ChatGPT 发布,生成式人工智能的实用性和采用率突然上升。对于我的咨询公司 TodAI 来说,这意味着很多涉及生成式人工智能的新项目和大量的学习。在完成了几个项目之后,我发现了生成式模型在应用于商业时与其他人工智能明显不同的地方。有些很小,有些则非常重要。这些新的生成式人工智能模型如何改变应用人工智能的游戏规则?术语如果我们区分生成式人工智能和预测式人工智能,讨论这些变化会更容易。生成式人工智能是指大型预训练模型,

如何在短短 5 分钟内仅使用合成数据构建可运行的 AI

How to build a working AI only using synthetic data in just 5 minutes

合成数据在人工智能中日益流行。它将使人工智能更便宜、更好、更少偏见。它也非常容易获得和使用。在很短的时间内,它已经从一项实验技术变成了某种东西,我会毫不犹豫地将其用于生产人工智能解决方案。为了说明这一点,我将构建一个可以区分苹果和香蕉之间差异的人工智能。我将只使用另一个人工智能生成的两个类别的图像——在本例中,使用 DALL-E Mini。苹果或香蕉识别器我将仅使用易于访问的免费 AutoAI 工具构建一个图像分类器。生成数据我们需要大约 30 张每个标签(香蕉和苹果)的图像。我们将使用 DALL-E Mini,这是 NVIDIA 文本到图像模型 DALL-E 2 的开源版本。要生成图像,您可

什么是人工智能的合成数据?

What is synthetic data for artificial intelligence?

本文是我即将出版的新书的片段,您可以在此处注册:https://www.danrose.ai/book。说实话,人工智能中的合成数据可能是我目前考虑最多的主题。在未来几年中,它具有巨大的潜力,可以同时改善隐私、降低偏见并提高模型准确性,这是一次巨大的技术飞跃。Gartner 甚至表示,“到 2024 年,用于开发人工智能和分析项目的数据中有 60% 将由合成生成。”。考虑到当今许多从事人工智能工作的人甚至还没有开始采用这项技术,这是一个改变游戏规则的举措。合成数据是数据,但不是对世界的实际观察。它是人工或算法创建的假数据。它是人工或合成创建的,但其目标与真实数据相同 - 代表人工智能应该在其中

人工智能中的黑天鹅

Black Swans in Artificial Intelligence

本文是我即将出版的新书的片段,您可以在此处订阅:https://www.danrose.ai/book理解数据的一个重要概念是黑天鹅的概念。黑天鹅理论是由统计学家、《随机致富的傻瓜》一书的作者 Nassim Nicholas Taleb 创造的。我强烈推荐这本书。多年来,人们普遍认为黑天鹅并不存在。由于从未观察到黑天鹅,因此它们不存在于任何数据中。如果你当时押注于你看到的下一只天鹅是黑色的可能性,你可能会押注这种事件不会发生。事实证明,有很多黑天鹅。它们只是还没有被观察到。当我们发现澳大利亚时,它们第一次被发现,那里到处都是黑天鹅。换句话说,数据只代表已知和观察到的世界,而不是现实世界。这也是

人工智能领域专家的面试指南

The interview guide for domain experts in AI

本文是我即将出版的新书的片段,您可以在此处注册:https://www.danrose.ai/book当采访人工智能解决方案领域专家时,必须避免讨论特定的解决方案,而是专注于业务成果和手头的问题。当您采访专家时,他们有时会过早地确定某个解决方案,甚至在不知情的情况下。作为解决方案架构师,您也可能这样做,并错过更好的替代方案。我经常发现自己这样做,因为找到完美的解决方案是发现阶段最令人满意的部分。为了专注于问题和业务成果,我使用以下指南作为问题的灵感。问题:告诉我你上次做 X 的时间(例如预测销售额或在冰淇淋店做轮班计划)这个问题比“你如何进行预测?”更有效。这样问会给你一个完美的最佳答案。主题

三种 AI 采用策略

The three AI adoption strategies

AI 有多种不同的形状和大小。这适用于用例、底层技术以及在您的组织中采用 AI 的方法。由于许多组织都在寻求采用 AI,因此各行各业的领导者都越来越需要有形的框架来从商业角度理解这项技术。领导者提出的一些关键问题很简单。采用 AI 并通过 AI 解决业务问题需要多少时间和金钱,以及我们从这些努力中获得什么回报?这些问题非常合理,但回答这些问题是一个两方面的问题。首先,答案是一个不断变化的目标,因为技术正在呈指数级发展,因此昨天的答案在今天看来已经过时了。其次,AI 的无形性和探索性使得提供这样的答案变得非常困难。但随着 AI 作为一项技术日趋成熟,并被打包成产品和现成的解决方案,这些问题已经准

Lobe.ai 评论

Lobe.ai Review

Lobe.ai 刚刚发布公测版,简而言之,你应该去尝试一下。我很幸运,有机会在封闭测试版中测试它,所以我想我应该写一篇简短的评论。让人工智能对大多数人来说更容易理解和更容易使用是我花了很多时间的事情,而 Lobe 毫无疑问正合我意。他们的标语是“让机器学习变得简单”,这正是他们所做的。总的来说,这是一款很棒的工具,我认为它是人工智能技术的真正进步,它使人工智能和深度学习模型比 AutoML 浪潮已经做到的更容易使用。那么 Lobe.ai 到底是什么呢?Lobe.ai 是一个 Automl 工具。这意味着你无需编码即可制作人工智能。在 Lobe 的案例中,它们只处理图像分类。简而言之,你给 Lo

如何领导 AI 项目

How to lead AI projects

人工智能正在成为主流,许多组织、初创公司和大公司都在启动内部人工智能项目或将人工智能融入其他现有 IT。但有一个问题。领导人工智能项目与领导传统 IT 项目截然不同。因此,许多人工智能项目要么失败,要么引发项目参与者、人工智能用户和相关管理层的不满。他们没有意识到自己现在处于一个新的范式中,应该对 IT 抱有与通常不同的期望。即使实施现成的人工智能组件或系统也会导致组织不常见的问题。这是可以理解的。几年前,人工智能仍然是少数几家大型科技公司和大学参与的事情,但对于大众来说,这是一个遥远的未来。很少有领导者和项目经理有人工智能领域的经验,他们突然被投入到人工智能项目中。那么人工智能项目有什么不同

不要在 AI 中以数据为导向

Don’t be data-driven in AI

数据驱动通常被理解为积极的内涵,但当我听到这个词时,我对即将发生的“数据驱动”决策感到有些焦虑。让我来解释一下原因。根据维基百科,数据驱动的意思是“形容词数据驱动意味着活动的进展是由数据推动的,而不是由直觉或个人经验推动的。”换句话说 - 将数据视为采取行动的主要信息来源。当数据给你一个行动的理由时,你就采取行动。乍一看,这似乎是一种非常合理的工作方式,尤其是在人工智能领域,因为人工智能在很多方面都依赖于数据。但事实上,在使用人工智能时,数据驱动可能会非常成问题。我认为那些说自己是数据驱动的人走错了路。这并不意味着我反对花很多精力去理解你的数据。我实际上坚信,为人工智能项目收集、理解和准备数据

AutoML 解决方案概述

AutoML solutions overview

简介我一直在寻找 AutoML 解决方案的列表以及对它们进行比较的方法,但一直没能找到。所以我想我不妨编制一份清单供其他人使用。如果您不熟悉 AutoML,请阅读这篇文章以快速了解其优缺点。我还没有能够测试所有这些并做出适当的评论,所以这只是基于功能的比较。我试图挑选出我觉得最重要的功能,但它对你来说可能不是最重要的。如果您认为缺少某些功能,或者您知道应该在列表中的 AutoML 解决方案,请告诉我。在我们进入列表之前,我会快速介绍一下这些功能以及我如何解释它们。功能部署某些解决方案可以通过一键部署直接自动部署到云端。有些只是导出到 Tensorflow,有些甚至可以导出到边缘设备。类型可以是

开始 AI 项目前您应该了解的 6 件事

6 things you should know before beginning with AI projects

人工智能 (AI) 项目对大企业和企业家来说都变得司空见惯。因此,许多之前没有 AI 经验的人现在被任命负责 AI 项目。大约 5 年前,我第一次遇到这种情况,从那以后我学到了很多东西。以下是我希望在做第一个 AI 项目时就知道的六件事。1. 数据是最昂贵的部分 AI 经常被认为在技术上非常困难,需要大量资源来开发。但事实上,这并不是完全的事实。开发成本可能很高,但所需的绝大部分工作和资源通常用于获取、清理和准备开发所需的数据。数据也是让 AI 成功完成工作的最关键因素。因此,在制作 AI 模型时,您应该始终优先考虑优质数据而不是优质技术。因此,在为 AI 项目制定预算时,请确保您预留大部分时

使用更少数据打造更出色 AI 的 5 大方法

Top 5 ways to make better AI with less data

1. 迁移学习迁移学习现在在机器学习中被广泛使用,因为它的好处很大。总体思路很简单。你用大量数据和大量训练来训练一个大型神经网络。当你遇到一个特定问题时,你会“切断”大型网络,并用你自己的数据训练几个新的层。大型网络已经理解了很多一般模式,而通过迁移学习,你这次不必教给网络。一个很好的例子是,如果你试图训练一个网络来识别不同种类的狗的图像。如果没有迁移学习,你需要大量的数据,也许需要 100,000 张不同种类的狗的图像,因为网络必须从头开始学习一切。如果你用迁移学习训练一个新模型,你可能只需要每个种类的 50 张图像。你可以在这里阅读有关迁移学习的更多信息。2. 主动学习主动学习是一种数据收

什么是人工智能?- 务实的定义

What is artificial intelligence? - The pragmatic definition

人工智能没有明确的或学术上正确的定义。常见的定义通常将人工智能定义为以类似人类的方式执行任务并模拟智能行为的计算机模型。事实是,对于你向人工智能领域的每位专家询问定义,你都会得到一些新的定义变体。在某些情况下,你甚至可能会得到非常虔诚的教育,即只有系统包含深度学习模型才是人工智能。你是否问过许多初创公司创始人他们的系统是否包含人工智能,即使它只是一个非常简单的回归算法,就像我们在 Excel 中已经使用很久了一样。事实上,一家风险投资基金最近发现,声称是人工智能初创公司的初创公司中,只有不到一半的公司实际上拥有任何类型的人工智能。那么什么时候是人工智能?我的定义非常务实。对我来说,人工智能有一

模型辅助标记 - 是好是坏?

Model-assisted labelling - For better or for worse?

毫无疑问,对于许多 AI 项目来说,收集数据是项目最昂贵的部分。标记图像和文本片段等数据是一项艰巨而繁琐的工作,而且没有太大的扩展可能性。如果 AI 项目需要不断更新或获取新数据,那么这可能是一项高昂的成本,可能会对一个原本很棒的项目的整个商业案例构成挑战。不过,有一些策略可以降低标记数据的成本。我之前写过关于主动学习的文章;这是一种数据收集策略,侧重于在模型置信度最低的情况下优先标记最重要的数据。这是一个很好的策略,但在大多数情况下,您仍然需要标记大量数据。为了加快标记过程,出现了模型辅助标记策略。这个想法很简单,就是在标记的同时训练 AI,当 AI 开始在数据中看到某种模式时,AI 会向标

什么是数据操作 (DataOps)?

What is data operations (DataOps)?

当我撰写有关 AI 的文章时,我经常提到数据操作,以及它对大多数 AI 解决方案的重要性。如果没有适当的数据操作,您很容易陷入这样的境地:处理必要的数据将变得过于困难和昂贵,以至于 AI 业务案例毫无意义。因此,为了稍微澄清一下,我想让您了解它的真正含义。数据操作是以安全且经济高效的方式获取、清理、存储和交付数据的过程。它是业务战略、DevOps 和数据科学的混合体,是许多大数据和 AI 解决方案的底层供应链。数据操作最初是在大数据领域创造的,但在后来几年已成为一个更广泛使用的术语。数据操作是最重要的竞争优势正如我之前在许多帖子中提到的那样,当试图击败竞争对手时,我认为数据操作比算法开发更重要

5G 网络将如何影响 AI。简短且无流行语的版本

How the 5G network will affect AI. The short and no buzzword version

我听到过很多关于 5G 移动网络技术将如何改变世界,尤其是成为应用 AI 的重要推动者的说法。但这真的是真的吗?5G 会成为 AI 的游戏规则改变者吗?简短的回答是不会。5G 很好。它是一种方便的技术,对 AI 有好处,但绝不是什么大事。我能做出的最佳比较是 5G 就像新道路。询问 AI 解决方案背后的人 5G 是否会改变游戏规则,就像询问店主有关新道路的问题一样。而且是在已经有不错道路的地方。店主可能会回答类似这样的话:“这很好。我的供应商可以更轻松地运送货物,我的客户可以更轻松地找到我。这可能尤其适用于城市中的商店,因为新道路的使用率更高,因此优先考虑。但这不会立即影响我的商店利润。”。那

AI 骗局:天才算法

The AI hoax: The genius algorithm

有时,一个非常令人印象深刻的算法成就应该被庆祝。GPT-3 就是一个很好的例子。GPT-3 是令人惊叹的工程和数据科学,当之无愧地获得了媒体的广泛关注。但是对于每一个 GPT-3,都有数十万个基于标准算法的 AI 解决方案,它们不一定是天才成就,而是教科书式的方法。听起来好像我在尝试许多 AI 解决方案,但事实上恰恰相反。对于绝大多数 AI 案例来说,寻求突破性的天才解决方案并不是正确的做法。在大多数情况下,标准算法可以轻松完成手头的任务,超出这一范围的一切通常都是糟糕的业务。当有人声称自己拥有天才甚至特殊的算法时,请小心。考虑到这一切,我仍然听到很多关于某些公司为解决问题而开发的“独特”、“

何时购买和何时构建 AI

When to buy and when to build AI

在开始使用和实施 AI 时,最重要的问题之一也是最难回答的问题之一:您应该购买现成的 AI 产品,自行构建还是请顾问定制?这里没有一个万能的答案,但有一些考虑因素可以帮助您了解最适合您的方法。我将尝试仔细考虑这些考虑因素,让您最终决定最适合您业务的方法。AI 对您的业务是否具有战略意义?首先,我认为您应该问自己:AI 开发对我的组织来说是否具有战略意义?这个问题可能有点模糊,所以我将其归结为:AI 解决方案是否会为您提供竞争优势,您会尝试保护并不断改进以保持领先地位?如果 AI 只是为了改进,您的竞争对手可能很容易复制,那么您绝对应该购买现成的解决方案或聘请专家。建立所需的知识和组织能力来制造